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摘要 : 为 了 理解 紫花 首 蒂 叶绿体 基因 组 密码 子 偏 好 性 的 使 用 模式 , 该 文 以 紫花 首 蒂 叶绿体 
因 组 中 筛选 到 的 49 条 和 蛋白质 编 码 序列 为 研究 对 象 ， 利 用 CodonW、CUSP、CHIPS、SPSS 
等 软件 对 其 密码 子 的 使 用 模式 和 偏好 性 进行 分 析 。 结 果 表 明 : 紫花 首 蒂 叶绿体 基因 的 第 3 
位 密码 子 的 平均 GC 含量 为 26.87%， 有 效 密码 子 数 (ENC) 1E40.6—51.41 之 间 ， 多 数 密码 
子 的 偏好 性 较 弱 。 相 对 同 义 密码 子 使 用 度 (RSCU) 分 析 发 现 ，RSCU>1L 的 密码 子 数 目 有 
30 个， 以 A、U 结尾 的 有 29 个 ， 说 明了 紫花 首 蒂 叶绿体 基因 组 A 或 U 出 现 的 频率 较 高 。 
中 性 分 析 发 现 ，GCs 与 GC 的 相关 性 不 显著 ， 表 明 密 码 子 偏 性 主要 受到 自然 选择 的 影响 ; 
而 ENC-plot 分 析 发 现 一 部 分 基因 落 在 曲线 的 下 方 及 周围 , 表明 突变 也 影响 了 部 分 密码 子 偏 
性 的 形成 。 此 外 ， 有 17 个 密码 子 被 鉴定 为 紫花 首 带 叶绿体 基因 组 的 最 优 密 码 子 。 紫 花 首 蒂 
叶绿体 基因 组 的 密码 子 使 用 的 偏好 性 可 能 受到 自然 选择 和 突变 的 共同 作用 ,该 研究 将 为 紫花 
首 蒂 叶绿体 基因 工程 的 开展 和 目标 性 状 的 遗传 改良 葛 定 基础 。 
关键 词 ， 紫 花 首 蒂 ， 叶 绿 体 基因 组 ， 密 码 子 偏好 性 ， 最 优 密 码 子 
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Analysis of codon usage bias in the chloroplast genome of 


alfalfa (Medicago sativa) 
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Abstract: To character the codon usage patterns of chloroplast genome in alfalfa, forty-nine 
coding DNA sequences were analyzed using CodonW, CUSP, CHIPS and SPSS software. The 
results showed that the average GC content at the 3rd codon position was 26.8746 in the alfalfa 
chloroplast genome. The effective codon number (ENC) ranged from 40.6 to 51.41 indicates that 
codon bias was weak in the alfalfa chloroplast genome. Thirty codons showed relative 
synonymous codon usage (RSCU) value greater than 1, including 29 AT ending codons, which 
suggested that the third codon position preferred A or U. Neutrality analysis showed no significant 
correlation was observed between GC; and GC1, suggesting natural selection mainly contributed 
to the codon usage bias. However, ENC-plot analysis showed that there are some genes with low 


ENC values lying below or near the expected curve. It indicated that mutation also affected the 
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formation of codon usage bias. In addition, 17 codons were identified as optimal codons in alfalfa. 


We concluded that the codon usage bias of alfalfa is formed under effect of natural selection and 


mutational bias. This study will lay a good foundation for development of chloroplast genetic 


engineering and molecular breeding of alfalfa. 
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Kw Bt (Medicago sativa) 是 一 种 多 年 生 豆 科 牧 划 ， 由 于 其 具有 适口 性 好 ， 蛋 白质 含 


量 高 等 优点 ， 享 有 “牧草 之 王 ” 的 美誉 〈 杨 青川 和 孙 彦 ，2011 )。 其 栽培 范围 


四 | 


布 世 界 各 地 ， 


一 种 备 受 关 注 的 世界 性 优质 牧草 。 研究 表 明 ， 以 紫花 首 菠 作为 饲料 饲养 的 冀 禽 ， 可 以 提高 
禽 的 生产 、 繁 殖 ， 肉 品质 以 及 机 体 的 免疫 力 ( 李 刚 ，2019)。 近 年 来 ， 随 着 我 国 畜牧 业 的 


是 
畜 
发 展 ， 对 优质 牧草 的 需求 量 也 日 益 增 加 。 但 我 国 紫花 首 蒂 等 牧 革 产 业 的 发 展 术 
不 


puits, Ph 


足以 满足 我 国 市 场 需求 , 仍 需 进 口 大 量 牧草 。 这 使 得 紫花 音 薪 在 我 国 的 种 植 面积 不 断 增 加 ， 


然而 , 种 植 过 程 中 田间 病虫害 和 杂 草 等 问题 却 时 有 发 生 ,严重 时 会 导致 大 幅 减 产 和 品质 下 降 ， 


制约 着 我 国 首 蒂 产 业 的 发 展 ( 边 佳 辉 等 ，2020)。 传 统 的 育种 方法 在 解决 这 些 难 题 时 收效 其 
微 , 而 基因 工程 育种 技术 的 应 用 却 成 功 获得 了 大 量具 有 抗 病 虫 和 抗 除草 剂 等 优良 品质 的 作物 


材料 ( 杨 朝 国 等 ，2010， 郭 三 堆 等 ，2015)。 由 于 紫花 首 蒂 为 四 倍 体 植物 ， 遗 传 背景 复杂 ， 
与 利用 核 基因 工程 相 比 ， 叶 绿 体 基 因 工 程 则 具有 外 源 基因 可 以 定点 整合 、 基 因 拷 贝 数 多 、 母 


系 遗 传 等 优点 ( 程 霞 英 ，2004; 周 菲 等 ，2015; Jin & Daniell, 2015)。 因 此 ， 


利用 叶绿体 基 


因 工 程 引入 抗 病 、 抗 忠 、 抗 除草 剂 等 基因 到 紫花 首 菠 中 对 其 进行 对 遗传 性 状 改 恨 ， 将 对 畜牧 


业 的 可 持续 发 展 具有 十 分 重要 的 意义 。 


在 叶绿体 基因 工程 育种 中 ， 有 一 个 关键 的 环节 就 是 外 源 基 因 的 表达 。 而 研究 表明 外 源 
基因 的 表达 水 平 会 受到 物种 密码 子 偏 好 性 的 影响 (Hershberg & Petrov, 2008; Plotkin & Kudla, 
2011; Quax et al., 2015)。 对 某 一 种 生物 体 的 密码 子 偏好 性 使 用 模式 进行 研究 ， 再 根据 该 生 
物 的 最 优 密码 子 而 设计 外 源 基因 表达 载体 , 可 以 起 到 优化 外 源 基因 在 叶绿体 基因 组 中 的 表达 
的 作用 。 因此， 本 文 将 分 析 紫 花 首 薪 叶绿体 基因 组 密码 子 偏好 性 的 特征 及 其 密码 子 偏 性 的 影 


定 基础 。 
1 材料 与 方法 
1.1 叶绿体 基因 组 序列 的 获得 


响 因素 , 并 确定 其 最 优 密码 子 , 为 紫花 首 罕 叶绿体 基因 工程 的 开展 和 目标 性 状 的 遗传 改良 疯 


完整 的 紫花 首 蒂 叶绿体 基因 组 下 载 于 NCBI 数据 库 (GenBank 登录 号 为 KU321683.1) 


(Tao et al., 2017)， 从 该 叶绿体 基因 组 中 共 获 得 75 条 编码 蛋白 质 的 基因 序列 。 为 了 更 加 准 


确 分 析 密 码 子 偏 好 性 ， 首先 剔除 小 于 300 bp 的 基因 编码 序列 ， 其 次 选择 起 始 密码 子 为 ATG， 


终止 密码 子 为 TAA、TAG、TGA 的 基因 编码 序列 ， 最 终 一 共 获 得 49 条 序列 | 
分 析 ( 杨 国 锋 等 ，2015; X4, 2017). 

1.2 分 析 方 法 

1.2.1 相对 同 义 密码 子 使 用 度 分 析 


大 于 1， 表 示 该 密码 子 的 使 用 频率 比 其 他 同 义 密码 子 高 ， 反 之 亦 然 (Sharp & 
1.2.2 中 性 绘图 分 析 


] 于 后 续 的 数据 


使 用 CodonW 软件 对 往 选 出 的 49 条 序列 的 相对 同 义 密 码 子 使 用 度 (relative synonymous 
codon usage, RSCU) 进行 计算 。 当 RSCU 值 等 于 1， 表 示 该 密码 子 使 用 无 偏好 性 ; RSCU fü 


Li, 1987). 


为 了 分 析 有 关 密 码 子 偏好 性 的 影响 因素 , 利用 MEGAG 软件 分 别 统计 密码 子 3 个 位 置 的 
GC RE, GCh GCA GC 分 别 表示 为 第 一 、 第 二 和 第 三 位 密码 子 的 GC RE. GCs 表示 


同 义 密码 子 第 三 位 的 GC EE, GC 则 表示 第 一 位 和 第 二 位 密码 子 的 GC 含量 


的 平均 值 。 中 


性 绘图 分 析 时 ， 以 GC; 为 横 坐 标 、GCu 为 纵 坐 标 进行 绘图 。 
1.2.3 ENC-plot 绘图 分 析 

为 了 进一步 分 析 碱 基 组 成 对 密码 子 偏 好 性 的 影响 ,ENC-plot 绘图 分 析 以 GC3s 为 横 坐 标 、 
有 效 密码 子 数 (effective number of codon, ENC) 为 纵 坐 标 进行 绘制 散 点 图 。 绘 图 中 的 ENC 
标准 曲线 计算 公式 为 ENC = 2+GC3s+29/ [GC3s (1 一 GC3s) ] (Wright, 1990). 
1.2.4 奇偶 偏好 (parity rule 2, PR2) 分 析 

为 了 评估 密码 子 第 三 位 碱 基 A 与 T 或 C 与 G 之 间 的 组 成 偏差 是 否 对 密码 子 偏好 性 产生 
影响 , 对 具有 4 个 同 义 密 码 子 编码 的 氨基 酸 的 各 密码 子 第 三 位 的 碱 基 组 成 进行 作 图 分 析 。 计 
算 每 个 基因 Ay(A3+T3) 和 G3/((G3+C3) 后 ， 分 别 以 Ax(A3+T3) 和 G3/(G3+C3) 作 纵 坐 标 和 横 坐 
标 作 图 ， 平 面 图 中 心 表示 A=T， 同 时 G=C (Sueoka, 2001). 
1.2.5 最 优 密码 子 的 确定 

本 文 以 ENC 值 为 偏好 性 标准 确定 最 优 密 码 子 。 首先 , 将 ENC 值 进行 排序 , 然后 从 ENC 
值 最 高 和 最 低 的 两 极 各 选 10% 的 基因 ， 分 别 建成 高 低 偏 性 库 〈 低 ENC 值 对 应 高 偏 性 库 )， 
并 分 别 计算 RSCU 值 和 高 低 两 库 的 A RSCU。 最 后 ， 选 取 两 库 A RSCU > 0.08, H RSCU>1 
的 密码 子 定 义 为 最 优 密码 子 〈 王 鹏 良 等 ，2019 )。 
2 结果 与 分 析 
2.1 密码 子 组 成 分 析 

将 紫花 首 蒂 叶绿体 基因 组 中 的 49 条 编码 序列 作为 一 个 整体 进行 碱 基 组 成 分 析 ， 结 果 表 
明 其 平均 GC EEN 36.55%, GC GC GC, 含量 分 别 为 45.66%、37.13% 和 26.87%. FH 
此 可 以 看 出 密码 子 不 同位 置 的 碱 基 组 成 的 GC 分 布 并 不 是 均匀 的 ， 其 中 GC; 含量 最 高 ， 而 
GC; 含量 最 低 。 
有 效 密 码 子 数 测量 的 是 某 基因 的 密码 子 偏 好 程度 ,理论 上 的 取 值 范围 为 21~60。 当 某 一 
基因 平均 地 使 用 每 一 个 密码 子 ， 则 其 有 效 密码 子 数 为 60; 当 某 一 个 基因 只 使 用 每 组 同 义 
密码 子 中 的 一 个 ， 则 其 有 效 密码 子 数 为 20。 参 考 前 人 研究 以 ENC 值 为 35 作为 偏 性 强 弱 的 
分 标准 (Comeron & Aguadé, 1988)。 本 研究 结果 显示 ， 紫 花 首 蒂 叶 绿 体 基 因 组 ENC 取 值 
围 都 在 40.6 以 上 ， 因 此 紫花 首 带 叶绿体 基因 密码 子 偏 性 普遍 较 弱 ( 表 1)。 

K1 紫花 首 蒂 叶绿体 基因 组 密码 子 不 同位 置 的 GC 含量 


Table 1 GC contents of different positions on chloroplast genome codon of Medicago sativa 


e DAN 


E [A GC 含量 GC content (96) 

ENC 
Gene GCan GC, GC; GC; GCis 
clpP 38.95 55.61 34.18 27.04 22.00 50.13 
psbB 42.76 55.21 45.97 27.11 23.10 45.28 
petB 40.59 47.69 41.67 32.41 26.60 44.97 
petD 39.54 51.55 37.89 29.19 26.10 46.57 
rpoA 31.94 43.71 29.94 22.16 20.60 43.20 
rpsll 42.45 52.52 53.96 20.86 18.70 45.49 
rpli4 35.23 47.15 38.21 20.33 19.20 45.65 
rpl16 43.38 51.47 50.74 27.94 23.00 42.277 
rps3 34.26 44.65 34.88 23.26 21.20 45.63 
rpl2 42.15 51.45 47.46 27.54 25.70 51.24 
ycf2 35.42 40.67 32.14 33.46 31.10 51.41 
ndhB 36.17 41.58 38.54 28.40 24.40 47.51 


rps7 40.60 51.28 44.87 25.64 22.30 43.17 


rps12 42.20 52.42 48.39 25.81 25.40 43.60 


ycfl 30.63 37.28 27.73 26.87 24.60 48.58 
ndhH 36.55 51.02 35.28 23.35 17.80 47.73 
ndhA 32.97 41.03 38.04 19.84 17.20 42.02 
ndhl 33.54 42.59 35.19 22.84 19.50 43.93 
ndhG 32.58 41.81 33.33 22.60 20.00 45.04 
ndhE 33.99 42.16 33.33 26.47 22.70 50.30 
ccsA 31.79 33.95 35.19 26.23 21.20 48.05 
ndhF 30.87 36.11 34.63 21.88 18.30 43.61 
psbA 41.62 50.00 42.94 31.92 27.50 41.48 
matK 30.44 36.09 30.37 24.85 23.10 48.23 
rbcL 42.51 57.35 43.70 26.47 23.50 44.92 
atpB 42.23 57.43 41.75 27.49 25.60 46.99 
atpE 38.65 48.55 37.68 29.71 26.50 50.67 
ndhC 33.88 44.63 31.40 25.62 19.80 41.75 
ndhK 36.99 42.54 42.11 26.32 23.70 51.36 
ndhJ 37.95 49.69 36.48 27.67 23.50 44.12 
rps4 37.13 51.49 38.12 21.78 20.30 43.55 
yc 月 38.86 46.75 38.46 31.36 28.60 50.82 
psaA 41.37 51.91 42.69 29.51 25.30 49.29 
psaB 40.45 48.71 42.99 29.66 25.00 47.82 
rpsl4 40.59 45.54 46.53 29.70 27.10 45.42 
psbC 42.48 52.95 46.20 28.27 24.30 43.70 
psbD 42.66 52.54 43.22 32.20 27.80 45.63 
rpoB 37.85 49.58 37.82 26.14 23.90 47.71 
rpoC1 36.28 48.48 37.59 22.79 20.20 45.86 
rpoC2 34.26 43.11 35.45 24.22 22.20 46.50 
rps2 36.99 43.88 42.19 24.89 21.00 45.67 
atpl 35.35 46.77 35.08 24.19 21.80 43.65 
atpF 36.10 45.08 33.16 30.05 28.70 51.15 
atpA 39.33 54.79 39.73 23.48 22.00 44.61 
accD 35.11 43.91 35.73 25.71 22.90 44.17 
cemA 31.88 35.65 28.70 31.30 27.60 46.77 
petA 3821 52.34 36.14 26.17 24.80 49.07 
rps18 30.93 33.33 36.04 23.42 21.30 40.60 
rpl20 34.27 35.92 37.32 29.58 26.50 49.86 
F 25] fü 37.20 46.57 38.59 26.44 23.37 46.26 
Average 


ik: GC, GC. GG 分 别 表 示 密 码 子 第 一 、 第 二 和 第 三 位 碱 基 GC 含量 ;GC3s 表示 同 义 密 码 子 第 三 位 碱 基 
GC 含量 ;GC 表示 密码 子 总 GC 含量 。 


hn 


Notes: GC1, GC», GC; mean GC value of the first, second, third position of codons, respectively; GC3s means GC 
value of third position of synonymous codons; GCan means GC value of each gene. 

碱 基 组 成 和 有 效 密码 子 数 的 相关 性 分 析 结 果 显 示 : GCau 和 GCh GC». GC; 的 相关 性 都 
达到 了 极 显 车 水 平 ， 并 且 第 一 位 碱 基 组 成 和 第 二 位 碱 基 组 成 的 相关 性 也 达到 了 极 显 著 水 平 ， 


但 两 者 与 第 三 位 碱 基 组 成 的 相关 必 


数 仅 与 GC; 的 相关 性 达到 极 显著 水 3 


编码 基因 的 密码 子 偏好 性 影响 
表 2 紫花 首 逢 叶绿体 基 基 


LE 均 未 达到 显著 水 平 ( 表 2)。 表 明 紫 花 首 落叶 绿 体 编码 基 
因 密 码 子 第 一 位 和 第 二 位 碱 基 组 成 较 相似 , 但 与 第 三 位 碱 基 组 成 却 存在 差异 ; 而 有 效 密码 子 
FE， 说 明 密 码 子 第 三 位 上 的 碱 基 组 成 对 紫花 首 落 叶绿体 


组 中 相关 参数 的 相关 性 分 析 


Table 2 Correlation analysis of related parameters on chloroplast genome of Medicago sativa 


GC, 
GC; 0.599" 
GC; 0.097 

GCai 0.865” 
ENC -0.550 


2.2 中 性 绘图 分 析 


中 性 绘图 分 析 结 果 如 


iE: ** 表示 在 0.01 水 平 上 显著 相关 。 


Note: ** means significant differences at the 0.01 level. 


E] 1 所 示 , FH 


0.394" 


GC, GC, 
0.106 0.848" 
0.848" 0.394" 
0.410 0.002 


4 一 0.334 6， 几 乎 各 基因 


ENC 
-0.177 
0.410" 
0.002 


图 可 知 GCy, 分 布 于 0.321 8 一 0.532 4, GC 2) fi F 0.198 
的 坐标 点 都 未 落 在 对 角 线 上 或 沿 着 对 角 线 分 布 。GCi 和 GC 的 相关 


系数 为 0.113 3， 统 计 结 果 表 明 两 者 的 相关 性 不 显著 。 回 归 曲 线 斜 率 为 0.181 2， 表 明 GC1s 


和 GC. 的 相关 性 较 弱 。 进 一 步 说 明 突变 对 密码 子 仿 性 的 形成 的 影响 较 弱 ， 
TE) 可 能 对 密码 子 的 偏好 愧 


0.64 


0.54 


0.4 4 


0.34 


GC 


0.24 


0.14 


0.0 


形成 影响 较 大 。 


y =0.181 2x +0.377 9 


0.0 


R^- 0.0128 
T T T T T 
0.2 0.3 0.4 
GC, 


图 1 KHET TREA E EAT P 


其 他 因素 (如 选 


Fig. 1 Neutrality plot analysis of chloroplast genes of Medicago sativa 


2.3 ENC-plot 绘图 分 析 


为 了 进一步 分 析 碱 基 组 成 对 密码 子 偏好 性 的 影响 ，ENC-plot 绘图 以 有 效 密码 子 数 为 纵 


沿 标准 


his. GCas 为 横 坐 标 ， 定 位 所 有 基 
| 线 分 布 或 位 于 标准 | 


ZEIT C 


zH 


出 上 分 析 所 有 参与 研究 基 


比值 分 布 在 -0.05~0.15 之 间 ， 该 范 


对 紫花 首 蒂 叶绿体 基因 组 


因 的 坐标 系 ， 同 时 添加 标准 


HZ. 。 结 果 显 示 大 部 分 基因 


围 内 实际 ENC 与 期 望 ENC 值 相差 较 小 。 因 
密码 子 偏好 性 的 形成 影响 较 大 。 


人 | 

i 图 2)。 为 了 进一步 反映 差异 ， 根 和 
出 ENC 的 理论 值 ， 再 根据 公式 ENCratio=(ENCexp-ENCop)/ENCexp 求 算 出 ENC 
因 的 ENC 频数 分 布 ( 表 3)。 统 计 结 果 表 明 ， 大 多 数 


E ENCexp 公式 求 


比值 。 在 此 基 
的 基因 的 ENC 
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图 2 紫花 首 蒂 叶绿体 基因 的 ENC-plot 分 析 


Fig. 2 ENC-plot analysis of chloroplast genes of Medicago sativa 
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2.4 PR2-plot 分 析 
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表 3 ENC 比值 频数 分 布 
Table 3 Distribution of ENC ratio 
组 中 值 组 数 组 频 
Class middle value Number Frequency 

-0.1 4 0.0816 

0 29 0.591 8 
0.1 15 0.306 1 
0.2 1 0.020 4 
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基 A 与 T、C 与 G 之 间 的 关系 (图 3)。 结 果 显示 ， 大 部 分 基因 分 布 在 图 的 右 下 方 ， 表 明 密 


码 子 第 三 位 T 的 使 用 频率 高 于 A G 的 使 用 频率 高 于 C。 如 果 密 码 子 使 用 模式 仅 受 到 突变 的 
IT. G 和 C 的 碱 基 使 用 频率 理论 上 应 该 相等 。 但 本 研究 的 结果 显示 A 和 T、G 
和 C 的 使 用 存在 不 均衡 ， 表 明 紫 花 首 菩 叶 绿 体 密码 子 的 使 用 模式 不 仅 只 受到 突变 的 影响 ， 


影响 ， 则 A 夭 


还 可 能 受到 其 他 因素 ， 如 选择 等 的 影响 。 
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图 3 ZEE SUE ERTERAEDSI PR2-plot 分 析 
Fig. 3 PR2-plot analysis of chloroplast genes of Medicago sativa 
2.5 相对 同 义 密码 子 使 用 度 分 析 
紫花 首 荐 叶绿体 基因 组 中 各 氢 基 酸 的 相对 同 义 密码 子 的 使 用 度 分 析 如 表 4 所 示 , 结果 显 
示 共 有 30 个 密码 子 的 RSCU 大 于 1。 其 中 以 U 或 A 结尾 的 密码 子 占 比 为 96.67%， 以 U 结 
尾 的 为 13 个， 以 A 结尾 的 为 16 个 ， 说 明 紫 花 首 蒂 偏爱 使 用 结尾 为 U 和 A 的 密码 子 。 


表 4 紫花 首 逢 叶绿体 基因 组 中 各 氨基 酸 的 RSCU 分 析 


Table 4 RSCU analysis of protein coding region in chloroplast genome of Medicago sativa 


AER 密码 子 数目 

Amino acid Codon Codon i 
ENAR Phe UUU 814 1.42 
UUC 330 0.58 

丝氨酸 Ser UCU 436 1.77 
UCC 217 0.88 

UCA 287 1.17 

UCG 135 0.55 

MAHR Tyr UAU 629 1.66 
UAC 128 0.34 

EARR Trp UGG 346 1.00 
半 胱 氨 酸 Cys UGU 157 1.50 
UGC 52 0.50 

TA Leu UUA 714 2.05 
UUG 432 1.24 

CUU 436 1.25 

CUC 100 0.29 

CUA 289 0.83 

CUG 119 0.34 

MAER Pro CCU 341 1.68 


CCC 141 0.69 


组 氨 酸 His 


谷 氨 酰胺 Gln 


HAR Arg 


苏 氨 酸 Thr 


天 冬 酰胺 Asn 


ll 


HAR Lys 


丝氨酸 Ser 


KAR Ala 


CCA 
CCG 
CAU 
CAC 
CAA 
CAG 
CGU 
CGC 
CGA 
CGG 
AUU 
AUC 
AUA 
ACU 
ACC 
ACA 
ACG 
AAU 
AAC 
AAA 
AAG 
AGU 
AGC 
AGA 
AGG 
GUU 
GUC 
GUA 
GUG 
GCU 
GCC 
GCA 
GCG 
GAU 
GAC 
GAA 
GAG 
GGU 
GGC 
GGA 
GGG 
AUG 
UAA 
UAG 


UGA 11 0.67 


2.6 最 优 密码 子 的 确定 

本 文 根 据 A RSCU 法 确定 最 优 密码 子 。 首 先 ， 将 ENC 值 进 行 排序 ， 然 后 从 ENC 值 最 高 
和 最 低 的 两 极 各 选 10% 的 基因 ， 分 别 建成 高 低 偏 性 库 ， 并 分 别 计算 RSCU 值 和 高 低 两 库 的 
A RSCU( 表 5)。 结果 发 现 两 库 人 A RSCU > 0.08 的 一 共有 27 个 高 表达 密码 子 ( 表 5 中 * 标 明 )。 
选取 表 5 中 的 高 表达 的 密码 子 和 表 4 中 的 高 频密 码 子 相 结合 进行 分 析 , 将 其 共有 密码 子 定义 
为 最 优 密码 子 。 最 终 确定 了 紫花 首 蒂 叶绿体 基因 组 的 最 优 密码 子 17 个 (UGU、UUA、CCU、 
CCA, CAA, CGU. ACU, ACA, AAA, AGA, GUU, GUA, GCU, GAU, GAA, GGU 
和 UAA), EX 17 个 最 优 密码 子 中 ， 全 以 A 或 U 结尾 ， 此 结果 与 GCu 和 GC3 的 高 A、T 
含量 一 致 。 


表 5 紫花 首 逢 叶绿体 基因 组 最 优 密码 子 分 析 


Table 5 Putative optimal codons in chloroplast genome of Medicago sativa 


氨基 酸 密码 高 表达 基因 低 表 达 基 因 
Amino Acid F High expressed genes Low expressed genes ARSCU 
Codon 数目 Number RSCU Zi E Number RSCU 
茶 丙 氨 酸 Phe UUU 48 1.28 101 1.20 0.08 
UUC 27 0.72 67 0.80 -0.08 
丝氨酸 Ser UCU* 37 224 68 1.75 0.49 
UCC 11 0.67 35 0.90 -0.23 
UCA 19 1.15 54 1.39 -0.24 
UCG 9 0.55 21 0.54 0.01 
MAHR Tyr UAU 30 1.43 99 1.66 -0.23 
UAC* 12 0.57 20 0.34 0.23 
色 氨 酸 Trp UGG* 26 2 40 1.90 0.10 
ŽAR Cys ^ UGU* 4 2 21 1.35 0.65 
UGC 0 0 10 0.65 -0.65 
TAM Leu UUA* 40 2 83 1.68 0.32 
UUG 20 1 65 1.32 -0.32 
CUU 28 1.40 67 1.36 0.04 
CUC 3 0.15 19 0.39 -0.24 
CUA* 26 1.30 41 0.83 0.47 
CUG 3 0.15 21 0.43 -0.28 
IJAH Pro CCU* 24 2.04 43 1.61 0.43 
CCC 6 0.51 21 0.79 -0.28 
CCA* 13 1.11 25 0.93 0.18 
CCG 4 0.34 18 0.67 -0.33 
组 氨 酸 His CAU 7 1.27 52 1.51 -0.24 
CAC* 4 0.73 17 0.49 0.24 
谷 氮 酰 腕 Gln CAA* 26 1.79 68 1.40 0.39 
CAG 3 0.21 29 0.60 -0.39 
精 氨 酸 Arg CGU* 18 1.85 26 1.11 0.74 
CGC 6 0.62 13 0.55 0.07 


CGA 13 1.33 41 1.74 -0.41 


CGG 2 0.21 
FEAR Ile AUU 58 1.43 
AUC 23 0.57 
AUA 30 1.03 
苏 氨 酸 Thr ACU* 17 1.45 
ACC 10 0.85 
ACA* 17 1.45 
ACG 3 0.26 
天 冬 酰 胺 Asn AAU 27 1.20 
AAC* 18 0.80 
赖 氨 酸 Lys AAA* 35 1.79 
AAG 4 0.21 
丝氨酸 Ser AGU 18 1.09 
AGC* 5 0.30 
精 氨 酸 Arg AGA* 16 2.56 
AGG 4 0.64 
ZR? Val GUU* 30 1.82 
GUC* 8 0.48 
GUA* 26 1.58 
GUG 2 0.12 
WAAR Ala GCU* 42 147 
GCC 3 0.79 
GCA 21 1.07 
GCG y 0.67 
RAR Asp  GAU* 23 1.77 
GAC 3 0.23 
RAR Glu GAA* 43 1.59 
GAG 11 0.41 
甘氨酸 Gly GGU* 40 1.90 
GGC 6 0.29 
GGA 29 1.38 
GGG 9 0.43 
HRA Met AUG* 28 0.97 
终止 密码 子 TER UAA* 4 0.64 
UAG* 1 0.16 
UGA 0 0 

注 : * 表示 高 表达 密码 子 。 


Note: * indicates 


high expression codons. 


3 讨论 与 结论 


在 长 期 进化 过 程 中 ， 特 定 物种 为 了 适应 自身 的 基因 组 环境 , 得 
偏好 性 受到 基因 组 大 小 、CpG 
基因 密度 、 基 因 序 列 长 度 、 基 因 表 达 水 平 、tRNA 丰 度 、 蛋 白质 二 级 结构 以 及 


性 的 密码 子 使 
分 布 的 位 置 、 


120 


106 


用 模式 〈 李 平等 ，2011)。 密 码 子 的 使 | 


密码 子 变异 偏 


0.60 
1.43 
0.57 
1.19 
1.31 
0.83 
1.34 
0.51 
1.59 
0.41 
1.37 
0.63 
1.21 
0.21 
2.30 
1.57 
1.64 
0.34 
1.16 
0.86 
1.47 
0.79 
1.07 
0.67 
1.66 
0.34 
1.27 
0.73 
0.96 
0.42 
1.80 
0.82 
0.81 
0.09 
0.04 
0.10 


往 形 成 了 


E1] 


在 


有 偏好 


&. Gc 


好 性 等 多 种 因素 影响 (Hanson & Coller, 2018; Paul et al., 2018)。 其 中 自然 选 


择 和 突变 是 影响 密码 子 使 用 偏 性 的 两 个 主要 因素 ,也 是 目前 备 受 关注 的 两 个 因素 (Sharp et al., 
2010; Rao etal., 2011; 石 元 豹 等 ，2018)。 由 于 密码 子 第 三 位 碱 基 突 变通 常 受到 的 选择 压 较 
第 一 、 二 位 上 的 碱 基 小 , 因此 分 析 密 码 子 第 三 位 碱 基 的 碱 基 组 成 对 密码 子 的 使 用 模式 研究 具 
有 重要 意义 ( 原 晓 龙 等 ，2020)。 本 研究 表明 紫花 首 逢 叶绿体 基因 组 各 基因 第 三 位 密码 子 碱 
EES AMT, 5# (Medicago truncatula) ( 杨 国 锋 等 ,2015 )、 酸 束 (Ziziphus jujuba 
var. spinosa)《 胡 晓 艳 等 ，2019)〉 和 蝴蝶 兰 (Phalaenopsis aphrodite subsp. formosana) (fi 
等 ，2010) 等 植物 叶绿体 基因 组 第 三 位 密码 子 使 用 偏 性 相似 ,表明 这 类 植物 的 叶绿体 基因 组 
密码 子 使 用 模式 具有 高 度 相 似 性 。 这 提示 我 们 高 等 植物 叶绿体 基因 组 可 能 含有 较 高 的 AT 碱 
基 含 量 ， 量 密码 子 使 用 模式 的 偏好 性 在 进化 上 存在 一 定 的 保守 性 。 
紫花 首 蒂 的 叶绿体 基因 组 编码 基因 的 ENC 值 都 大 于 40.6, 说 明 紫 花 首 蓓 基因 组 存在 较 
弱 的 密码 子 偏 性 。 中 性 绘图 分 析 结 果 表明 紫花 首 菠 叶绿体 基因 组 密码 子 GC 与 GC. 相关 
性 不 显 着 ， 表 明 密 码 子 的 使 用 偏 性 可 能 更 多 的 受到 选择 的 影响 ， 而 ENC-plot 绘图 分 析 表 明 
突变 是 部 分 基因 密码 子 偏好 性 形成 的 重要 因素 ; PR2-plot 分 析 的 结果 则 进一步 显示 密码 子 的 
偏好 性 不 仅 受 到 突变 的 影响 还 受到 选择 的 影响 。 因 此 ,在 长 期 的 进化 过 程 中 ， 紫花 首 和 带 叶 绿 
体 基因 组 密码 子 的 使 用 偏 性 更 多 的 受到 选择 的 影响 , 而 突变 也 是 部 分 基因 的 密码 子 偏 性 形成 
的 重要 因素 。 这 与 前 人 对 剑 豚 (Agave hybrid)( 金 刚 等 ，2018)、 麻 子 (Panicum miliaceum) 
《 刘 慧 等 ，2017) 和 梧桐 属 植物 〈 陆 奇 丰 等 ，2020) 的 叶绿体 基因 组 密码 子 偏 性 影响 因素 分 
析 结 果 相 似 , 表明 影响 植物 叶绿体 基因 组 密码 子 偏 性 的 因素 是 综合 性 的 。 但 具体 的 影响 机 制 
还 有 待 通过 进一步 的 深入 研究 来 揭示 。 
本 研究 将 高 表达 的 高 频密 码 子 定义 为 最 优 密码 子 ， 在 紫花 首 蒂 叶绿体 基因 组 中 确定 的 
17 RRETA UGU, UUA, CCU, CCA, CAA, CGU, ACU, ACA, AAA, AGA, 
GUU, GUA, GCU, GAU, GAA, GGU 和 UAA。 这 些 最 优 密码 子 都 以 A I U 碱 基 结 尾 ， 
RHK (Medicago tuncatula)〈 杨 国 锋 等 ，2015)、 巨 核 (Eucalyptus grandis) (E HÉ 
良 等 ，2019 )、 靡 子 (Panicum miliaceum) CX 3$ S&, 2017) 和 籽粒 苋 (Amaranthus 
hypochondriacus) Binza, 2019) 等 物种 叶绿体 基因 组 最 优 密码 子 分 析 结 果 一 致 。 同 时 
最 优 密码 子 的 结果 提示 在 紫花 首 蒂 的 叶绿体 基因 工程 的 外 源 基因 载体 的 设计 时 , 选用 这 些 A 
uy U 碱 基 结 尾 最 优 密 码 子 或 可 提高 外 源 基 因 的 表达 效率 。 
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